1
Парадигмальный сдвиг: от дообучения к инференсу по подсказкам
AI030Lesson 7
00:00

Представьте труд создания мозга по сравнению с простой передачей ему сценария. В предыдущую эру обработки естественного языка, адаптация домена была изнурительным процессом переносного обучения или PEFT (эффективное дообучение по параметрам). Мы рассматривали модели как глину, требующую тысяч размеченных примеров для физического изменения внутренних весов — процесс, который был вычислительно затратным и порождал статичные, чрезмерно специализированные версии моделей, таких как BERT.

Традиционный (веса)Маркировка данных + видеокартаИзменённый ΔWСовременный (контекст)Инженерия подсказокЗамороженная СОТАСдвиг: от «обучения мозга» к «управлению мозгом»

Катализатор GPT-3

Выпуск GPT-3 стал прогрессивным (СОТА) вехой. Было доказано, что обучение в контексте—где модель распознаёт паттерны непосредственно из подсказки—часто соответствует или превосходит результаты специализированного дообучения для общих задач. Мы перешли к инференсу на основе подсказок, где задержка и стоимость обновления градиентов заменяются стратегическим внедрением контекста.

Реальный пример
Создание юридического аналитика раньше требовало недель дообучения BERT на судебных делах. Сегодня разработчик использует подсказку с тремя образцами договоров, достигая сопоставимой точности за минуты с помощью замороженной модели ИИ.